[レポート]Snowflake Summit Opening Keynote #SnowflakeDB #SnowflakeSummit

[レポート]Snowflake Summit Opening Keynote #SnowflakeDB #SnowflakeSummit

Clock Icon2023.06.28

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

この記事は、2023年6月26日~29日開催のSnowflake Summit 2023のセッション『Snowflake Summit Opening Keynote』に関するセッションレポートです。

セッション概要

概要

Think you know Snowflake? Think again. Snowflake has been on a journey to break down silos to help organizations put their data to work. From high-performance analytics at scale to global collaboration across shared data to enabling full programmability without sacrificing governance, Snowflake continues to redefine what's possible with data ... and we're just getting started. Join Snowflake CEO Frank Slootman, President of Product Benoit Dageville, SVP of Product Christian Kleinerman, and Senior Director of Engineering and Founding Engineer Allison Lee as they unveil the next wave of innovations. You'll also see live demos from Snowflake's engineering and product teams, and hear directly from some of the most well-known global organizations on how the Snowflake Data Cloud is helping them unlock their biggest data ambitions.

(DeepL翻訳)Snowflakeを知っていると思いますか?そうではありません。Snowflakeは、組織がデータを活用できるよう、サイロを取り払う旅をしてきました。スケールの大きな高性能アナリティクスから、共有データ間のグローバル・コラボレーション、ガバナンスを犠牲にしない完全なプログラマビリティの実現まで、Snowflakeはデータで何が可能かを再定義し続けています。Snowflake CEOのFrank Slootman氏、製品担当社長のBenoit Dageville氏、製品担当SVPのChristian Kleinerman氏、エンジニアリング・シニア・ディレクター兼創業エンジニアのAllison Lee氏とともに、イノベーションの次の波を披露します。また、Snowflakeのエンジニアリングチームと製品チームによるライブデモをご覧いただき、Snowflakeのデータクラウドがどのようにお客様の最大のデータ野望を解き放つのに役立っているかについて、最も有名なグローバル組織から直接お聞きいただけます。

登壇者

  • Frank Slootman氏:Chairman and Chief Executive Officer, Snowflake
  • Benoit Dageville氏:Co-Founder & President of Product, Snowflake
  • Christian Kleinerman氏:SVP, Product, Snowflake
  • Jeff Hollan氏:Director, Product Management, Snowflake
  • Unmesh Jagtap氏:Principal Product Manager, Snowflake
  • Allison Lee氏:Sr. Director, Engineering, Snowflake
  • Saras Nowak氏:Senior Product Manager, Snowflake
  • Polita Paulus氏:Principal Engineer, Snowflake
  • Mihir Shah氏:CIO, Enterprise Head of Data Architecture, Fidelity

Frank氏による冒頭挨拶

  • AI戦略について
    • AI戦略を持つにはデータ戦略を持つ必要がある
  • データクラウド
    • 白い斑点の一つ一つがユニークな雪の結晶(Snowflakeアカウント)であり、繋がっている線はデータシェアなどで繋がっていることを示す
    • fiserv.社のデータクラウドでは、Clover社という子会社と繋がっていたり、fiserv.社のデータを提供するFinTech企業もある。これは金融サービスのデータクラウドの1つにズームアウトしているだけ。実際には、40の異なる地域、世界中にまたがる大きな大きな雪の結晶のようなデータクラウドが構築されている。

  • データのサイロ化について
    • データのサイロ化は、新しいワークロードやアプリケーションの導入によりすぐに生まれてしまい、それと戦わなければいけない。
    • Snowflakeの核となるテーマは「データのサイロ化をなくすこと」
  • データクラウドを構成するデータについて
    • 構造化データ、半構造化データ、非構造化データ、多様なデータがある
    • しかし、非構造化データは人が読めてもソフトウェアが読むことはできない。
    • そこで非構造化データを解析するためにApplica社を買収しました。セッションの後半でDocument AIについても紹介します。
  • Hybrid Tableについて
    • 2022年のSnowflake Summitで発表したHybrid Tableはトランザクション処理と分析処理の両方を行えるオブジェクト
    • この機能に対する需要は非常に高いため、より強固な機能となるようにプッシュしていきます
  • サイバーセキュリティとデータエンジニアリングの関係性について
    • サイバーセキュリティにおける問題は、ビッグデータの統合の問題でもある
    • 私がセキュリティアナリストなら、データをSnowflakeに保存し一連のIPレンジを照会できれば業務が楽になるし、AIと連携させると色々な質問にも答えられるようになるだろう
  • Snowflakeをアプリケーションのバックエンドで使うことについて
    • Snowflakeは、人々がアプリケーションを作りたくなるような場所になるよう、努力してきた
    • パブリッククラウドをベースとしたインフラ、多様なワークロード、マーケットプレイスに加え、収益化のためのトランザクション機能も構築しました。これはソフトウェア開発にとって、何かを作ったり、何かを売ったり、何かを取引したりするのに非常に魅力的な場所です。私たちは、Snowflake上でソフトウェア開発のルネッサンスを起こそうとしています。私たちは、アプリケーションはデータベース上ではなく、データ・クラウド上に構築されるべきだと考えています。
    • これまでのデータに関わる専門家も重要なオーディエンスであるが、アプリ開発者などより技術的なユーザーが望む体験を提供できるようにここ2~3年フォーカスしてきた。今後も全てのユーザーに満足してもらえるようにしていく

ここから、簡単に3つの発表をする

  • 3つの発表1つ目:Iceberg Tableについて
    • すでにIcebergテーブルフォーマットへの対応は発表していたが、あらゆるデータを参照したり対処できるように機能アップデータを行った、詳細は後述。
  • 3つの発表2つ目:Native Application Framework
    • しばらくSnowflakeが注力してきた分野
    • Native Application Frameworkでは、共通のフレームワークとデータベースエンジンで開発から提供ができる。AndroidとiOSなど、複数の開発・デプロイ環境を考慮する必要はない
  • 3つの発表3つ目:Snowpark Container Service
    • アプリケーション・サービス全体をSnowflakeの中で実行することを考えた
    • コンテナの中にはLLMのモデルをホストすることもできるし、今後もこの分野は急速な発展が見込まれる
  • 改めて、「NO LIMIT」について
    • 「NO LIMIT」とは、アプリケーションの限界を押し広げ、データ利用の限界を押し広げ、Snowflakeの限界を押し広げるということです。
    • つまり、データ・クラウドにいかなる制限も設けないということであり、それはSnowflakeの約束でもあります。これを続けていきます。

創業者であるBenoit氏を交えた対談

  • AIにおけるSnowflakeのビジョン
    • 私たちは長年にわたって、AIやMLに何度も何度も投資をしてきました
    • しかし、今この瞬間に本当に興奮しているのは、Generative AIが初めてデータへのアクセスを本当に民主化しようとしているということです
    • 例えば、これまでデータを作成するためには、Pythonでのプログラミング方法を知っている必要があり、専門家がダッシュボードやその他のものをプログラムし、ビジネス・ユーザーがデータにアクセスできるようにしなければなりませんでした。だから常に摩擦があった。それが今、突然、Generative AIの登場によりPythonでのプログラミングを知らなくてもよくなった。
    • 加えて、データクラウドがどのようにすべてのワークロードをデータクラウド化し、セキュリティ、ガバナンス、パフォーマンス、使いやすさを提供するかということも重要です。これはAIにも当てはまり、AIワークロードはすべてデータクラウドで実行したいものです
  • Generative AIについて
    • これは、新しいヒューマン・コンピュータ・インターフェースとしての言語モデルです。
    • 過去50年間、私たちはコンピューターやプログラマーのルールに従って生活しなければなりませんでした。突然、私たちは自然言語でアプリケーションを使ってコンピュータと対話し、実際に私たちが言っていることを理解してもらうことができるようになった
    • Snowflakeは、安全でセキュアで効率的なデータとアプリケーションを提供する信頼できるプラットフォームのため、より優れたカタログ検索、SQLをより速く書くのを助けてくれるアシスタント、データに対する洞察を得るためのアシスタント、といった点でGenerative AIが役立つと思う

新機能の発表

冒頭挨拶

  • 今日は大きく3つの章に分けて説明
    • 1つ目:Single Platform
    • 2つ目:アプリケーションの分散・デプロイ・収益化
    • 3つ目:トレードオフなしにデータから価値を引き出すデータプログラミングの方法

Single Platform

  • これまでのSnowflakeにおけるデータの保存場所について
    • Snowflakeの創業者たちは当初、データをSnowflakeに取り込むことを考えていた
    • しかし、多くの方から外部ストレージにあるデータとやり取りできるようにしたいというフィードバックを頂き、外部テーブルを導入した
    • その後、Icebergテーブルフォーマットについての外部テーブルとIceberg Tableを発表した。しかし、時にはパフォーマンスを気にするためIceberg Tableとして使いしたいし、時には読み書きをさせたくない場合もある
    • そこで、今日のエキサイティングな発表があります
  • 外部のIcebergテーブルフォーマットとやり取りをする「Unified Iceberg Tables」を発表
    • ManagedモードとUnmanagedモード、2つのモードがある
    • Unmanagedモードは従来の外部テーブルで参照したときよりも2倍以上速い速度のパフォーマンスを持つ

  • Document AI
    • 買収したApplicaを用いて、Snowflakeに保存されている文書に対して自然言語で問い合わせをすることができる
    • この問い合わせにより得た結果をテーブルに入れて、別のユーザーやAIのモデルが使うことができる
    • 以下、Document AIのデモのスクリーンショット ※おまけで、YouTubeのリンクも貼っておきます。

  • Snowflakeにおけるデータガバナンスについて
    • Generative AIの時代において、いつ個人情報がどのモデルで使われるかは誰にもわからない
    • この観点から、私たちは、データの分類、何が機微か、何が準機微か、他のデータのマスキングに至るまで、データを安全に保護するための最も包括的なプラットフォームを提供したいと考えています。

  • 地理空間データのサポートの拡大
    • GeometryについてのサポートがGAとなったことで、あらゆるタイプの空間ベクトルオブジェクトをsnowflakeに取り込み、球面であろうと平面であろうと分析を行うことができるようになった
    • さらに、パブリックプレビューでは、異なる空間システム(Spatial systems)を簡単に切り替えることができます。例えば、州レベルのシステムとグローバルなシステムを切り替えるユースケースに対応しています。
  • SQLから直接MLモデルを操作
    • 現在パブリックプレビューの機能では、より信頼性の高い時系列予測を構築し、何が指標の変化に寄与しているのかを素早く特定し、異常を検出してアラートを発することができる
    • MLを利用した一連の関数が用意されており、機械学習の専門知識がなくてもそれができる

  • パフォーマンスの向上
    • Snowflakeのエンジニアは、皆さんのためにSnowflakeをより速くすることに取り組んでいる
    • Snowflakeのパフォーマンスを測るための指標としてSnowflake Performance Index(SPI)を開発
    • 2022年8月に初めてこのインデックスの追跡を開始して以来、2023年4月末までの約8ヶ月間で、Snowflakeの安定したワークロードのクエリ時間が15%改善したことがわかりました
    • ※参考までに、SPIを公開しているページと、SPIに関する参考記事もURLを貼っておきます。

  • Budgets機能
    • 選択したリソースのサブセットに対して追跡したい予算を指定し、その予算を超えたときにアラートを受け取ることができます
  • Warehouse Utilization機能
    • ある時点でウェアハウスがどの程度利用されているかを確認することができ、もっと大きな倉庫を持つべきか?もっと小さな倉庫にした方がいいのか、それとも統合した方がいいのか、提案をしてくれる機能です

  • Fidelity Investments社のShaw氏によるSingle Platformの事例事例
    • 組織において、データを素早く洞察に変換したり、データドリブンの新製品を発売したり、顧客や業務に対する理解を深めたりすることは、簡単なことではない
    • 3年ほど前に始まった変革の初期段階では、複数のデータウェアハウスを持っていて、レガシィなデータベースが170あった。データがサイロ化されている状態だった。
    • これらの170のデータベースを全て排除し、Snowflakeという1つのプラットフォームに統合することに取り組んだ。現在は、Snowflakeが本番稼動しています。800のデータセットがあります。このプラットフォームでは、毎日約7500人のユーザーが利用しており、現在200のアプリケーションがこのプラットフォーム上で稼働しています。

アプリケーションの分散・デプロイ・収益化

  • アプリケーションの分散・デプロイ・収益化とは
    • データセットであったりネイティブアプリであったりするデータ製品を、どのように配備し、流通させ、収益化するかについての話。
    • Snowflakeでは、私たちのSnowflake Marketplaceが鍵
  • Cybersyn社を交えたMarketplaceの事例
    • Cybersyn社はSnowflakeネイティブで、Marketplaceにコンテンツを提供するサービス会社。Cybersin社のミッションは、世界の経済データを利用できるようにし、使えるようにすること。
    • インフレデータ、人口データ、などのデータを提供し、500以上のSnowflakeアカウントが登録している
    • 今回、2つの独自製品をこの場で発表します。これは単なるデータセットではなく、Streamlightのようなデータセットとネイティブ・アプリケーションです。私たちは消費者支出データセットとEコマース・データセットを発表し、小売CPGや金融サービスのクライアントに役立つと考えています。

  • Native Apprlication Frameworkが今日パブリックプレビュー
    • Snowflake Marketplaceはデータだけではなく、ネイティブアプリケーションも配布できるようになりました。ここ数カ月はプライベート・プレビューにとどまっていましたが、今日パブリックプレビューです
    • 25以上のプロバイダー、40以上のアプリがMarketplaceですでに公開されています。また、承認待ちのキューにはさらに80か90のアプリがあるようです
    • さらに、「Custom Event billing」を発表します。ユーザーごとに1回限りの課金を行いたい場合、使用量ベースの課金を行いたい場合、そうでない場合、どのようなモデルであっても課金を簡素化します。
    • 課金のコンセプトでよくお客様から耳にするのは、Snowflakeのクレジットでデータやアプリを購入したいというものでしたが、SnowflakeへのCapacity Commitmentを引き出すことで、Marketplaceから購入することができるようになりました。これは現在、米国のすべてのお客様にご利用いただけます。今後も拡大していく予定です。

  • Native Application Frameworkについて
    • 今日AWSホストのSnowflakeでNative Application Frameworkを提供できることが大変嬉しい
    • 今日のデモでは、個人的に好きなVS Codeを使って、Snowflake拡張機能を用いてアプリケーションを構築します
    • すでにコードは用意していて、StreamlitのアプリケーションのためのPythonのコードを用意しています
    • アプリのデプロイで必要なのは、アプリ設定のためのマニフェストファイルと、コンシューマアカウントにアプリケーションをインストールするセットアップスクリプトだけです
    • アプリケーションをパッケージ化したら、対象のSnowflakeアカウントでインストールしてコマンドを実行すればOK
    • Snowflake上でバージョン管理もできる
    • 収益化の設定もSnowflake上で可能
    • コンシューマ視点では、従来のデータのMarketplaceと同じ形でアプリケーションを使用することができる
    • ※下記のリンク先のQuickStartで、このデモと同じようなことを体験することが出来ます!

トレードオフなしにデータから価値を引き出すデータプログラミングの方法

  • Developer Experienceについて
    • 皆さんがデータからより多くの価値を引き出し、プログラミングの種類やセキュリティ、プライバシーに妥協することなく、データをプログラミングできるようにお手伝いします
    • PythonとREST APIを提供することにコミットしているだけでなく、新しいSnowflake CLIも発表します
    • Snowflake CLIは、完全にオープンソースのツールで、開発者中心のユースケースにフォーカスしています
    • 新しいLoggingとTracingに関するAPIも今日パブリックプレビューとなります。ストアプロシージャや関数をデバッグしたり、コードやアプリケーションのパフォーマンスを理解するために必要なことは何でもできます
    • さらに、GitのブランチとSnowflake間でコードを同期することも可能です

  • Snowparkについて
    • Snowparkは2022年の11月に一般公開されたばかりですが、Snowflakeの顧客の30%以上が毎週利用していて、毎日1000万回以上のクエリを実行している
    • Python 3.10への対応など、新しいランタイムへの対応も行っている

  • Snowparkを使うユーザーからの声
    • Snowparkを使うことで、新しいソリューションをより迅速に市場に投入することができる。私たちが新しいAI・MLモデルを構築し、それらをテスト・反復・改良していく中で、Snowparkが提供する完全なフレームワークは、ゲームチェンジャーであり、高速で使いやすく、より広範囲に採用することで、私たちのビジネスに利益をもたらすことができると考えています。
    • Snowflakeを導入する前は、データサイエンスのワークロードを実行するためにSparkクラスタにアクセスするために、Snowflakeから別の場所にデータを移動しなければならず、データへのアクセスが容易ではありませんでした。
    • Snowparkを使えば、データサイエンティストはPythonを使うことができます。Pythonは多くのデータ・サイエンティストが好んで使うツールなので、私たちにとってはとても重要です。Snowparkのおかげで、データを手に入れるために多くの労力を費やすよりも、データサイエンティストはすぐに顧客の問題解決に取りかかることができます。
  • ストリーミングパイプライン
    • Snowpipe StreamingはもうまもなくGAとなる予定
    • また、Dynamic Tableのパブリックプレビューを開始しました

  • ストリーミングパイプラインのデモ
    • プラスチック製品などの生産に使う射出成形機からセンサーデータを収集し、メンテナンスデータと照らし合わせて分析できる継続的なデータパイプラインを構築してみます。これにより品質エンジニアはリアルタイムで新たな洞察を得ることができ、稼働時間とスループットが常に改善されていることを確認することができます。
    • まず始めに、射出成形機からのセンサーデータを取り込むために、Snowpipe Streamingを使用するSnowflakes Kafkaコネクタを使用してみます。Snowpipe Streamingを使うことで、ストレージを介すことなく直接Snowflakeのテーブルに書き込む事が可能です
    • 続いて、現在パブリックプレビュー中のDynamic Tableを使ってパイプラインを作成します。Dynamic Tableの定義では、変換の出力をSQLとして定義するだけでOKです。LAG='1 min'とすることで、1分置きに更新処理が行われます。
    • 2つ目のDynamic Tableでは、1つ目に作成したDynamic Tableとマシンの位置情報を結合します。これもSQLで定義するだけでOKです
    • Dynaminc Tableは常に実体化されているため高速で、かつ更新時は差分のみが処理されるため低コスト。更に複雑なパイプラインの定義も不要
    • 各テーブルのRefresh Historuの画面で、過去24時間の更新状況を確認することもできます
    • 各テーブルのGraphの画面で、各テーブルの依存関係を見ることもできます
    • また、これは別の新機能だが、LLMを使用してコメントからテーブル定義するためのDDL文のクエリを自動生成することも可能です

  • AI・MLについて
    • まずSnowflakeは、AI・MLのソリューションを構築するためのプラットフォームであることを約束します。特徴量エンジニアリング~トレーニング~スコアリングまで、すべてのライフサイクルをサポートしたいと考えています
    • このために、今日2つの新しいライブラリをパブリックプレビューとして発表します
    • 1つ目は、前処理に関するものです。One-Hotエンコーディングなどの処理を行える「snowflake.ml.preprocessing」です
    • 2つ目は、Snowflakeの内部で分散アルゴリズムを使ったトレーニングを行う「snowflake.ml.modeling」で、現場で見られるような最も一般的なアルゴリズムを学習したりできます
    • また、Snowpark Model Registryも発表します。これにより、学習したモデルの管理を行うことができます

  • Streamlitについて
    • 学習後のモデルをユーザーに提供することができないユーザーがどれだけいるでしょうか。そんなときに、Streamlitが役に立ちます
    • Streamlitの進化も止まらず、編集可能なデータフレームを発表できることを大変嬉しく思います。これにより、データの入力とプレゼンテーションの両方が可能になり、アプリをストリームライン化することができます。
    • また、新しいStream Live Chat Componetも発表します。チャットインターフェースの再開発はもう不要です

  • Streamlit in Snowflake
    • StremlitをSnowflakeの中で開発する機能は、もうまもなくパブリックプレビューの予定です
    • 現在この機能はプライベートプレビューですが、2000以上のアプリケーションがSnowflakeの中で作成され、公開されています。

  • Snowpark Container Service
    • Snowparkをリリースしたときは、JavaとPythonがあれば大丈夫だと言っていたが、Rust、Kotlin、C++などで使うことは出来ないか考えてみた
    • 「Snowflakeがしたいことは、価値を生み出すまでの時間を短縮すること」 - 「より多くのランタイム、より多くの言語、より多くのライブラリをサポートできるようにしたかった」これを実現する最速の方法が、Snowpark Container Serviceです(現在プライベートプレビュー)
    • この機能を使うことにより、Snowflakeのガバナンスの境界内でDockerコンテナを安全にホストすることができます
    • コンテナサービスを停止したり、ジョブとして公開したり、SQLステートメントやSnowparkアプリケーションから実行可能なプロシージャーや関数として呼び出したり、ということができます。あるいは、これまでのSnowflake史上で初めて、Snowflakeの中で長時間稼働するサーバーを持つことができるようになります
    • また、インスタンスの柔軟性についても必要性をお客様から聞いていました。Snowparkのコンテナサービスの一部として、実行できるハードウェアの種類や使用できるメモリの量など、より幅広いリストがあります。そして、GPUのサポートも可能です

  • Snowpark Container Serviceを用いた機械学習のデモ
    • スキーゴーグルを作る時、機械の故障は非常にコストがかかり、混乱を招く恐れがあります。そこでSnowpark Container Serviceを用いて、機械の故障を予測・防止するためのモデルをトレーニングしてみます。
    • Snowpark Container Serviceを使えば、自分のSnowflakeアカウントでどんなコードもどんなコンテナも簡単に実行できる。しかしそれだけでなく、MarketplaceからインストールしたSnowflakeネイティブアプリの一部としてサードパーティのコンテナを実行することもできる
    • 例えばノートブックのサービスだとHexがよい開発経験ができるが、サードパーティ製のサービスなのでネットワークやアカウント間の連携のために様々な承認を得る必要があります
    • しかし、Snowpark Container Serviceのおかげで、SnowflakeのNative ApplicationとしてHexのようなコンテナアプリを自分のSnowflakeアカウントで管理できるようになります
    • さらに、Snowpark Container Serviceを使えば、Nvidia AIエンタープライズの一部として、NVIDIA GPUとセキュアなNVIDIA AIプラットフォームを使って、このモデルのトレーニングをスピードアップできます。NVIDIA RapidsとNVIDIA AI Enterpriseに含まれるデータサイエンスのライブラリも選択可能です
    • トレーニングは時間の関係上事前に行っていましたが、NVIDIA AIプラットフォームのパワーを使って、5,000万レコードのデータセットをわずか17分でトレーニングすることができました。同様のトレーニングは、NVIDIAのアクセラレーションなしでは10倍の時間がかかりました。そして、コスト面でも2倍のコスト削減につながります
    • また、トレーニング後のモデルはSnowpark Model Registryを使えば、本番環境への安全なデプロイを行うことができます(デモではPythonでコードを書いてデプロイ)

  • Platform for Large Language Models
    • SnowflakeはAIアプリケーションのための全ての要素を持っています。最も重要なデータは安全なプラットフォーム上に保持されます

  • NVIDIA・A21labs・Rekaとのパートナーシップの発表

  • デモ:Native Application FrameworkとSnowpark Container Serviceを使用した大規模言語モデル(LLM)の構築
    • スキーゴーグルの製造会社で、品質管理について考えてみます
    • 様々な製造ラインで製造しており、様々な製品の問題があります。そこで、品質管理社が対話的に品質管理を行えるようにしたいのですが、このためには非常に強力なモデルが必要です
    • このために、NVIDIA AIプラットフォームによって加速されたSnowflakeのNative Application FrameworkとSnowpark Container Serviceを使用して、大規模言語モデル(LLM)を使用してみます
    • Rekaのようなサードパーティは、彼らの主要なLLMをSnowflake Native Applicationとしてパッケージ化し、Marketplaceで提供ができます。コンシューマ側は、MarketplaceでRekaが提供しているアプリケーションをインストールするだけでよい
    • Rekaがどのようにモデルを構築しているのかは、コンシューマである私の目に触れることはない。同時にコンシューマの私にとっても、LLMと対話するために、あるいは微調整のために使用する私のSnowflakeアカウントのデータはすべて、決してReka側で見ことができない
    • 実際にMarketplaceからインストールして使ってみます。このアプリには、モデルとの対話に使用できる合理化されたインターフェイスがあります。モデルはマルチモーダルで、テキストと画像の両方で動作します。このアプリは、生産ラインの画像があるSnowflakeのステージに安全にアクセスできます
    • モデルに対してファインチューニングを行うこともでき、これによりユーザーが持つ独自のデータ(会社の製品や製品名の情報)を結果として返すこともできる
    • デモの要約として、Snowflake Marketplaceから直接LLMを搭載したアプリケーションをインストールし、データのセキュリティやガバナンスを損なうことなく、私のデータがあるSnowflakeアカウントで実行することができました。アプリケーションはすべてSnowflakeで構築され、サードパーティのLLMはNVIDIAアクセラレーションのSnowpark Container Serviceを使用してホストされました。アプリケーションにはモデルとの対話に使用できるチャット型のインターフェイスがあります。そして、これらの全てがSnowflake Native Appsとしてパッケージ化されています。
    • ※YouTubeに同様のデモが公開されていたので、そのリンクも下記に貼っておきます

Snowpark Container Serviceに対応したサードパーティ製品の簡易デモ

  • Astronomer社によるManaged Airflow

  • Alteryx

  • SAS

  • Dataiku

  • Hex

  • NVIDIA

  • Carto

  • W&B

  • RelationalAI

  • まとめ

  • ぜひ、パビリオンにいるSnowpark Container Serviceを統合頂いた30社を訪ねてみてください

最後に

  • これはSnowflakeサミットの始まりであるだけでなく、Snowflakeの内部で動作する新しいタイプのユースケースやアサービスの新しい時代の始まりでもあります。
  • 願わくば、今日の話を聞いて何が可能となるか考えてほしいです「どうすれば環境をシンプルにできるか?」「環境を統合するには?」「データからより多くの価値を引き出すには?」「私たちはどのようにデータで可能なことを変えていくのでしょうか?」
  • 素晴らしいSnowflake Summitをお楽しみください。それでは!

所感

まず一言、非常に盛り沢山のOpening Keynoteでした!!

個人的には、Document AI、Native Application Framework、Snowflake Container Service、といった目玉機能はもちろんですが、15%のパフォーマンス改善、クレジットの予算を決められるBudgets機能、Gitとの連携など、ユーザーにとって「嬉しい!」「それを待ってた!」という機能も多く発表されていたことが非常に嬉しかったです。

Native ApplicationについてはすでにQuickStartも提供されてパブリックプレビューになっているなど、すぐに試せる機能もあります。Snowflakeの最新機能をガンガン使っていきましょう!!

Share this article

facebook logohatena logotwitter logo

© Classmethod, Inc. All rights reserved.